智能论文笔记

AI Ethics Statements -- Analysis and lessons learnt from NeurIPS Broader Impact Statements

Carolyn Ashurst , Emmie Hine , Paul Sedille , Alexis Carlier

分类：人工智能 | 机器学习

2021-11-02

已提出伦理陈述作为提高透明度的机制，促进对公布研究的社会影响的思考。在2020年，通过要求所有文件包括更广泛的影响声明，机器学习（ML）会议神经潜水区破坏了新的地面。在2021年删除了这一要求，支持核对清单方法。因此，2020年陈述提供了从更广泛的影响实验中学习的独特机会：调查这种和类似治理机制的益处和挑战，并熟悉ML研究人员如何考虑自己工作的社会影响。这种学习是必要的，因为神经潮支和其他场地继续质疑并调整他们的政策。要启用此功能，我们已创建包含来自所有Neurips 2020文件的影响语句的数据集以及附加信息，如附属类型，位置和主题区域，以及用于探索的简单可视化工具。我们还提供了对数据集的初始定量分析，涵盖了代表性，参与，共同主题和愿意与福利讨论潜在危害的愿意。我们调查这些如何因地理，附属类型和主题领域而异。借鉴这些调查结果，我们讨论了道德声明要求的潜在利益和负面结果，以及他们可能的原因和相关挑战。这些导致我们从2020年要求中学到的几课：（i）创造正确的激励措施的重要性（ii）需要明确的预期和指导，以及（iii）透明度和建设性审议的重要性。我们鼓励其他研究人员使用我们的数据集来提供额外的分析，以进一步了解研究人员如何应对这一要求的理解，并调查这一要求和相关机制的益处和挑战。

translated by 谷歌翻译

RAFT: A Real-World Few-Shot Text Classification Benchmark

Neel Alex , Eli Lifland , Lewis Tunstall , Abhishek Thakur , Pegah Maham , C. Jess Riedel , Emmie Hine , Carolyn Ashurst , Paul Sedille , Alexis Carlier

分类：自然语言处理 | 人工智能 | 机器学习

2021-09-28

大型预先训练的语言模型已经显示了几次拍摄学习的承诺，只提供了几个任务特定示例给出了基于文本的任务。款式将很快解决到目前为止为人类研究助理保留的分类任务吗？现有的基准标记不设计用于衡量应用设置的进度，因此不要直接回答这个问题。 RAFT基准（现实世界注释的少量拍摄任务）侧重于自然发生的任务，并使用镜像部署的评估设置。 RAFT的基线评估揭示了当前技术斗争的地区：推理在许多班级的长篇文章和任务上。人类基线表明，非专家人类难以反映出一些分类任务，反映了现实世界的价值有时依赖于域名专业知识。甚至非专业人类基线F1分数超过GPT-3平均为0.11。 RAFT DataSets和排行榜将跟踪哪些模型改进在https://raft.elict.org中转化为现实世界的优势。

translated by 谷歌翻译

Bayesian Physics Informed Neural Networks for Data Assimilation and Spatio-Temporal Modelling of Wildfires

Joel Janek Dabrowski , Daniel Edward Pagendam , James Hilton , Conrad Sanderson , Daniel MacKinlay , Carolyn Huston , Andrew Bolt , Petra Kuhnert

分类：机器学习

2022-12-02

We apply Physics Informed Neural Networks (PINNs) to the problem of wildfire fire-front modelling. The PINN is an approach that integrates a differential equation into the optimisation loss function of a neural network to guide the neural network to learn the physics of a problem. We apply the PINN to the level-set equation, which is a Hamilton-Jacobi partial differential equation that models a fire-front with the zero-level set. This results in a PINN that simulates a fire-front as it propagates through a spatio-temporal domain. We demonstrate the agility of the PINN to learn physical properties of a fire under extreme changes in external conditions (such as wind) and show that this approach encourages continuity of the PINN's solution across time. Furthermore, we demonstrate how data assimilation and uncertainty quantification can be incorporated into the PINN in the wildfire context. This is significant contribution to wildfire modelling as the level-set method -- which is a standard solver to the level-set equation -- does not naturally provide this capability.

translated by 谷歌翻译

Improving astroBERT using Semantic Textual Similarity

Felix Grezes , Thomas Allen , Sergi Blanco-Cuaresma , Alberto Accomazzi , Michael J. Kurtz , Golnaz Shapurian , Edwin Henneken , Carolyn S. Grant , Donna M. Thompson , Timothy W. Hostetler

分类：自然语言处理

2022-11-29

The NASA Astrophysics Data System (ADS) is an essential tool for researchers that allows them to explore the astronomy and astrophysics scientific literature, but it has yet to exploit recent advances in natural language processing. At ADASS 2021, we introduced astroBERT, a machine learning language model tailored to the text used in astronomy papers in ADS. In this work we: - announce the first public release of the astroBERT language model; - show how astroBERT improves over existing public language models on astrophysics specific tasks; - and detail how ADS plans to harness the unique structure of scientific papers, the citation graph and citation context, to further improve astroBERT.

translated by 谷歌翻译

Multi-Scale Contrastive Co-Training for Event Temporal Relation Extraction

Hao-Ren Yao , Luke Breitfeller , Aakanksha Naik , Chunxiao Zhou , Carolyn Rose

分类：自然语言处理 | 人工智能 | 机器学习

2022-09-01

在文本中提取时间关系是自然语言理解的一个至关重要但充满挑战的问题。根据事件之间的距离，模型必须学会从事件对周围的本地和全局环境中进行不同的信息以进行时间关系预测。学习如何融合这些信息已证明对基于变压器的语言模型具有挑战性。因此，我们介绍了mulco：多尺度对比的共同训练，这是一种更好地融合本地和全球情境化特征的技术。我们的模型使用基于BERT的语言模型编码本地上下文和图形神经网络（GNN）来表示全局文档级句法和时间特征。与以前的最先进方法不同，该方法在多视图功能上使用简单的串联或使用复杂的强化学习方法选择最佳句子，我们的模型Co-Trains GNN和BERT模块使用多规模的对比度学习目标。 GNN和BERT模块通过将GNN多层多跳子图（即，全局上下文嵌入）和BERT输出（即局部上下文嵌入）进行对比，从而学习了协同参数化。我们从经验上证明，与当前的最新技术相比，Mulco提供了改进的使用Bert和GNN编码的本地和全球环境的能力。我们的实验结果表明，Mulco在几个时间关系提取数据集上实现了新的最新结果。

translated by 谷歌翻译

HTML版本

A Scalable and Extensible Approach to Benchmarking NL2Code for 18 Programming Languages

Federico Cassano , John Gouwar , Daniel Nguyen , Sydney Nguyen , Luna Phipps-Costin , Donald Pinckney , Ming Ho Yee , Yangtian Zi , Carolyn Jane Anderson , Molly Q Feldman

分类：机器学习

2022-08-17

大型语言模型已经证明了能够在自然语言和编程语言文本上进行条件和生成的能力。这样的模型打开了多语言代码生成的可能性：代码生成模型是否可以将知识从一种语言推广到另一种语言？尽管当代代码生成模型可以生成语义上正确的Python代码，但对它们使用其他语言的能力知之甚少。我们通过提出Multipl-E来促进该主题的探索，这是自然语言到代码生成的第一个多语言平行基准。 Multipl-E扩展了HumaneVal基准（Chen等，2021），以支持另外18种编程语言，涵盖了一系列编程范式和受欢迎程度。我们在Multipl-E：Codex和Incoder上评估了两个最先进的代码生成模型。我们发现，在几种语言上，法典匹配，甚至超过了其在Python上的性能。在多型E中表示的编程语言范围使我们能够探索语言频率和语言功能对模型性能的影响。最后，将代码生成基准分配给新编程语言的多重方法既可扩展又可扩展。我们描述了一种通用方法，可以轻松地增加对新基准和语言的支持。

translated by 谷歌翻译

A Spatio-Temporal Neural Network Forecasting Approach for Emulation of Firefront Models

Andrew Bolt , Carolyn Huston , Petra Kuhnert , Joel Janek Dabrowski , James Hilton , Conrad Sanderson

分类：机器学习

2022-06-17

野火传播的计算模拟通常在各种条件下（例如地形，燃料类型，天气）采用经验分布计算。条件下的小扰动通常会导致火灾传播（例如速度和方向）的显着变化，因此需要进行计算昂贵的大型模拟以量化不确定性。模型仿真寻求使用机器学习的物理模型的替代表示，旨在提供更有效和/或简化的替代模型。我们提出了一个专用时空神经网络，用于模型仿真，能够捕获火灾传播模型的复杂行为。所提出的方法可以在基于神经网络的方法通常具有挑战性的空间和时间分辨率上进行近似预测。此外，由于新的数据增强方法，即使使用小型训练集，提出的方法也是可靠的。经验实验表明，模拟和模拟的火山之间的良好一致性，平均Jaccard得分为0.76。

translated by 谷歌翻译

A Methodological Framework for the Comparative Evaluation of Multiple Imputation Methods: Multiple Imputation of Race, Ethnicity and Body Mass Index in the U.S. National COVID Cohort Collaborative

Elena Casiraghi , Rachel Wong , Margaret Hall , Ben Coleman , Marco Notaro , Michael D. Evans , Jena S. Tronieri , Hannah Blau , Bryan Laraway , Tiffany J. Callahan

分类：人工智能

2022-06-13

尽管电子健康记录是生物医学研究的丰富数据来源，但这些系统并未在医疗环境中统一地实施，并且由于医疗保健碎片化和孤立的电子健康记录之间缺乏互操作性，可能缺少大量数据。考虑到缺少数据的案例的删除可能会在随后的分析中引起严重的偏见，因此，一些作者更喜欢采用多重插补策略来恢复缺失的信息。不幸的是，尽管几项文献作品已经通过使用现在可以自由研究的任何不同的多个归档算法记录了有希望的结果，但尚无共识，MI算法效果最好。除了选择MI策略之外，归纳算法及其应用程序设置的选择也至关重要且具有挑战性。在本文中，受鲁宾和范布伦的开创性作品的启发，我们提出了一个方法学框架，可以应用于评估和比较多种多个插补技术，旨在选择用于计算临床研究工作中最有效的推断。我们的框架已被应用于验证和扩展较大的队列，这是我们在先前的文献研究中提出的结果，我们在其中评估了关键患者的描述符和Covid-19的影响在2型糖尿病患者中的影响，其数据为2型糖尿病，其数据为2型糖尿病由国家共同队列合作飞地提供。

translated by 谷歌翻译

Tensorial tomographic differential phase-contrast microscopy

Shiqi Xu , Xiang Dai , Xi Yang , Kevin C. Zhou , Kanghyun Kim , Vinayak Pathak , Carolyn Glass , Roarke Horstmeyer

分类：计算机视觉

2022-04-25

我们报告了张力层造影差异相位对比度显微镜（T2DPC），这是一种用于同时测量相和各向异性的无定量标签层析成像方法。T2DPC扩展了差异相位对比显微镜（一种定量相成像技术），以突出光的矢量性质。该方法求解了从配备有LED矩阵，圆极偏振器和偏振敏感摄像机的标准显微镜获得的强度测量的各向异性样品的介电常数张量。我们证明了各种验证样品的折射率，双折射和方向的准确体积重建，并证明生物标本的重建极化结构是病理学的预测。

translated by 谷歌翻译

Building astroBERT, a language model for Astronomy & Astrophysics

Felix Grezes , Sergi Blanco-Cuaresma , Alberto Accomazzi , Michael J. Kurtz , Golnaz Shapurian , Edwin Henneken , Carolyn S. Grant , Donna M. Thompson , Roman Chyla , Stephen McDonald

分类：自然语言处理

2021-12-01

用于探索美国国家航空航天局的搜索工具（广告）可以相当丰富和赋予（例如，类似和趋势的运营商），但研究人员尚未允许完全杠杆语义搜索。例如，对“普朗克任务的结果”查询应该能够区分普朗克（人，任务，常量，机构和更多）的所有各种含义，而无需从用户进一步澄清。在广告中，我们正在将现代机器学习和自然语言处理技术应用于我们最近的天文出版物的数据集，以培训Astrobert，这是一种基于Google研究的深刻语境语言模型。使用AstrBert，我们的目标是丰富广告数据集并提高其可发现性，特别是我们正在开发自己的命名实体识别工具。我们在这里展示我们初步的结果和经验教训。

translated by 谷歌翻译